2 research outputs found

    The Analysis of Rank Fusion Techniques to Improve Query Relevance

    Get PDF
    Rank fusion meta-search engine algorithms can be used to merge web search results of multiple search engines. In this paper we introduce two variants of the Weighted Borda-Fuse algorithm. The first variant retrieves documents based on popularities of component engines. The second one is based on k user-defined toplist of component engines. In this research, experiments were performed on k={50,100,200} toplist with AND/OR combinations implemented on ‘UNIB Meta Fusion’ meta-search engine prototype which employed 3 out of 5 popular search engines. Both of our two algorithms outperformed other rank fusion algorithms (relevance score is upto 0.76 compare to Google that is 0.27, at P@10). The pseudo-relevance automatic judgement techniques involved are Reciprocal Rank, Borda Count, and Condorcet. The optimal setting was reached for queries with operator "AND" (degree 1) or "AND ... AND" (degree 2) with k=200. The ‘UNIB Meta Fusion’ meta-search engine system was built correctly

    RANCANG BANGUN PROTOTIPE MESIN PENCARI-META ( META SEARCH ENGINE ) NON-CLUSTER UNTUK MENINGKATKAN RELEVANSI PENCARIAN HASIL KUERI DOKUMEN WEB

    No full text
    Mesin Pencari-Meta (Meta-Search Engine) Non-Cluster atau Algoritma Fusi yaitu menggunakan Algoritma KE (Renda et al, 2003), Weighted Borda Fuse (Fagin et al, 2003, Dorn et al, 2008), dan Fungsi Count (Patel et al, 2012) sejauh ini bisa meningkatkan tingkat relevansi hasil pencarian kueri. Penelitian ini membahas implementasi pada toplist K hasil pencarian dokumen (K = 50, 100, 200) mengunakan kombinasi operator kueri AND dan OR dan panjang kueri 2 terms dan 3 terms. Dalam penelitian ini dipilih 3 dari 5 mesin pencari yang ada ketika melakukan pencarian. Dalam penelitian ini juga kami memberikan bobot yang pada mesin pencari. Skenario default yaitu memberikan bobot mesin pencari berdasarkan tingkat popularitas. dan skenario yang lain yaitu Myown dengan memberikan bobot yang sama. Dikarenakan Human Judgement membutuhkan waktu yang banyak, maka penelitian ini disubtitusikan dengan Pseudo Relevance Evaluation (Automatic Judgement) yaitu Rank Position (Reciprocal Rank) Method, Borda Count Method, dan Condorcet Method (Nuray dan Can,2006). Hasil menunjukan bahwa hasil tingkat relevansi dokumen menggunakan algoritma Weighted Borda Fuse paling baik dibandingkan dengan yang lain, dan nilai Precision dibandingkan dengan mesin pencari asli (Google) meningkat hingga 182,28 % pada P@10 (K=200)
    corecore